检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. LU分解和Laplace算法在GPU上的实现

陈颖林锦贤吕暾

计算机应用 2011, 31 (03): 851-855. DOI: 10.3724/SP.J.1087.2011.00851

摘要（1362）

PDF （736KB）（988）

随着图形处理器（GPU）性能的大幅度提升以及可编程性的发展，已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心，但计算量往往很大，由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构（CUDA）编程模型实现这两个算法，通过对CPU与GPU进行任务划分，同时利用GPU上的共享存储器提高数据访问速度，对GPU程序进行分支消除，并且对矩阵分段计算以达到加速计算的目的。实验结果表明，随着矩阵规模的增大，基于GPU的算法相对于基于CPU的算法具有良好的加速效果。

相关文章 | 多维度评价

Select

2. 多核CPU和GPU加速分子动力学模拟

林江宏林锦贤吕暾

计算机应用 2011, 31 (03): 843-847. DOI: 10.3724/SP.J.1087.2011.00843

摘要（1312）

PDF （810KB）（979）

在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上，采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分，高效地利用了计算机的处理能力。性能测试结果表明，相对于优化后的CPU串行计算，多核CPU-GPU异构并行计算模型有强大的性能优势，特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行，获得了最高可达12倍的计算加速比。